Exploitation de dictionnaires électroniques pour la désambiguïsation sémantique lexicale
نویسندگان
چکیده
RÉSUMÉ. Cet article présente un système de désambiguïsation lexicale sémantique, conçu initialement pour l’anglais et à présent adapté à la désambiguïsation du français. La méthodologie développée repose sur l’utilisation d’un dictionnaire électronique comme un corpus sémantiquement étiqueté afin d’en extraire une base de règles de désambiguïsation sémantique. Ces règles permettent d’associer à un mot son sens compte tenu de son contexte. L’extraction et l’application des règles sont décrites en détail ainsi que l’évaluation du système. L’évaluation des résultats obtenus pour le français nous conduit à considérer un ensemble de perspectives concernant les ressources lexicales qui seraient les mieux adaptées à la tâche de désambiguïsation dans le cadre de cette méthodologie.
منابع مشابه
A State of the Art of Word Sense Induction: A Way Towards Word Sense Disambiguation for Under-Resourced Languages
______________________________________________________________________________________________ Word Sense Disambiguation (WSD), the process of automatically identifying the meaning of a polysemous word in a sentence, is a fundamental task in Natural Language Processing (NLP). Progress in this approach to WSD opens up many promising developments in the field of NLP and its applications. Indeed, ...
متن کاملEncodage des dictionnaires electroniques: problemes et propositions de la tei
Résumé Cet article décrit les principaux problèmes auxquels la Text Encoding Initiative (TEI) a dû faire face pour définir un standard d'encodage des dictionnaires électroniques. Ceux-ci sont, à cause de leur haut degré de structuration et de complexité, parmi les types de textes les plus difficiles traités par la TEI. Les problèmes les plus délicats étaient (1) le conflit entre la généralité d...
متن کاملVers un modèle d'indexation sémantique adapté aux dossiers médicaux de patients
This paper presents a semantic model adapted for the indexing of electronic patient records (EHRs) as a support to the process of finding medical information. Given the specificity of such documents, the indexing is based on the sequence of Natural Language Processing steps: semantic annotation based on the use of the MeSH (Medical Subject Headings) thesaurus, concept disambiguation, extraction...
متن کاملNommage de sens à l’aide des vecteurs conceptuels Word Sense Naming with Conceptual Vectors
Dans le cadre de la recherche en sémantique lexicale, nous utilisons le modèle des vecteurs conceptuels pour représenter les aspects thématiques des mots. La base vectorielle est construite à partir de définitions provenant de différentes sources lexicales, ce qui permet statistiquement de tempérer les diverses incohérences locales. Pour désigner le sens obtenu après un regroupement des définit...
متن کاملذخیره در منابع من
با ذخیره ی این منبع در منابع من، دسترسی به آن را برای استفاده های بعدی آسان تر کنید
عنوان ژورنال:
- CoRR
دوره abs/cs/0506049 شماره
صفحات -
تاریخ انتشار 2005